Objectifs d'apprentissage
- Identifier les composants essentiels d'un noyau CUDA en utilisant le spécificateur __global__
- Mettre en œuvre l'allocation de mémoire sur périphérique et le transfert de données entre l'hôte et le périphérique
- Calculer les indices de thread globaux pour mapper les éléments de données à des threads GPU individuels
- Exécuter et synchroniser un lancement parallèle de noyau en utilisant des configurations de grille et de bloc